home *** CD-ROM | disk | FTP | other *** search
/ The Datafile PD-CD 1 Issue 2 / PDCD-1 - Issue 02.iso / _utilities / utilities / 004 / _rsynth / !rsynth / README_sim < prev    next >
Text File  |  1993-10-29  |  5KB  |  141 lines

  1.  
  2. This is a text to speech system produced by integrating various pieces
  3. of code and tables of data, which are all (I believe) in the public domain.
  4.  
  5. The bulk of the intergration was done by myself, that is Nick Ing-Simmons.
  6. I can be reached via my employer at nicki@lobby.ti.com.
  7.  
  8. THIS PACKAGE HAS NO CONNECTION WITH TEXAS INSTRUMENTS; IT IS A PRIVATE
  9. PROJECT OF MY OWN.
  10.  
  11. Despite the E-mail address (which is via TI's US operation) I actually
  12. work in the UK.
  13.  
  14. Currently the only driver is for Sun SPARCStations but it should not be
  15. too hard to port it to other hardware.  For a discussion of these issues
  16. see INSTALL.
  17.  
  18.  
  19. The components (top down ) :
  20.  
  21.    say.c / say.h
  22.  
  23.       C main() function.
  24.       Initializes lower layers and then converts words from
  25.       command line or "stdin" to phonemes.
  26.       Some "normalization" of the text is performed, in particular
  27.       numbers can be represented as sequences of digits.
  28.  
  29.  
  30.    dict.c / dict.h
  31.  
  32.       A naive interface to the CUVOALD  (Computer  Usable Version of the Oxford
  33.       Advanced Learner's Dictionary).
  34.       This dictionary is further documented in "text710.doc", which also
  35.       describes is copyright status. If you can abide by the copyright terms
  36.       it can be obtained by anonymous FTP from the "Oxford Text Archive"
  37.       (see below).
  38.  
  39.       You will need to change the pathname at the top of "dict.c".
  40.  
  41.    text.c / english.c / text.h
  42.  
  43.       An implementation of US Naval Research Laboratory rules
  44.       for converting english (american?) text to phonemes.
  45.  
  46.       Based on the version on the comp.speech archives, main changes
  47.       were in the encoding of the phonemes from the so called "arpabet"
  48.       to a more concise form used in the above dictionary.
  49.       This form (which is nmemonic if  you know the International Phonetic
  50.       Alphabet), is described in the dictionary documentation. It is
  51.       also very close to that described in the postings by Evan Kirshenbaum
  52.       (evan@hplerk.hpl.hp.com)  to sci.lang and alt.usage.english. (The
  53.       differences are in the vowels and are probably due to the differences
  54.       between Britsh and American english).
  55.  
  56.  
  57.    saynum.c
  58.  
  59.       Code for "saying" numbers derived from same source as above.
  60.       It has been modified to call the higher level routines recursively
  61.       rather producing phonemes directly. This will allow any systematic
  62.       changes (e.g. British vs American switch) to affect numbers without
  63.       having to change this module.
  64.  
  65.  
  66.    holmes.c / holmes.h / elements.c / elements.def
  67.  
  68.       My implementation of a phoneme to "vocal tract parameters" system
  69.       described by Holmes et. al. [1]
  70.  
  71.       The original used an Analogue Hardware synthesizer.
  72.  
  73.    parwave.c / parwave.h / def_pars.c
  74.  
  75.       My recoding of the version of the "Klatt" synthesizer, described
  76.       in Klatt [2]. I obtained C source code from Jon Iles who had
  77.       modified the version originally posted to  "comp.speech".
  78.       I have extensively re-coded it in my C style as opposed to Klatt's
  79.       "original" which showed its FORTRAN ancestry.
  80.  
  81.       In my (non-expert) opinion, the changes are extensive enough
  82.       to avoid any copyright on the original.
  83.  
  84.       Only as small subset of the functionality of the synthesizer is
  85.       used by the "holmes.c" driver.
  86.  
  87.     hplay.c / hplay.h
  88.  
  89.       The driver for SPARCStations. It assumes that the (optional)
  90.       package /usr/demo/SOUND has been installed.
  91.  
  92.  
  93. Acknowledgements :
  94.  
  95.    Many thanks to
  96.  
  97.      Jon Iles       J.P.Iles@cs.bham.ac.uk
  98.  
  99.      Tony Robinson  ajr@eng.cam.ac.uk
  100.  
  101.    for assisting me in puting this package together.
  102.  
  103.  
  104. References :
  105.  
  106.    [1] Holmes J. N., Mattingly I, and Shearme J. (1964)
  107.        "Speech Synthesis by Rule" , Language Speech 7, 127-143
  108.  
  109.    [2] Dennis H. Klatt  (1980)
  110.        "Software for a Cascade/Parallel Formant Synthesizer",
  111.        J. Acoust. Soc. Am. 67(3), March 1980.
  112.  
  113.  
  114.  
  115.  
  116. Sources :
  117.  
  118.  
  119. OXFORD TEXT ARCHIVE
  120.  
  121. The Oxford Text Archive has for several years maintained copies of several
  122. machine-readable dictionaries along with its extensive (if
  123. unsystematic) collections of other machine-readable texts. This document
  124. gives some further details of the various dictionaries available, and
  125. summarises the conditions under which copies of them are currently
  126. distributed.
  127.  
  128. The Oxford Text Archive Shortlist  (available on request via electronic
  129. mail and by FTP) gives up to date brief details of all texts held in
  130. the Archive. Send electronic mail to ARCHIVE@VAX.OXFORD.AC.UK. For
  131. anonymous FTP, look in the directory ota on ox.ac.uk (129.67.1.165)
  132.  
  133.  
  134. Internet newsgroups :
  135.  
  136. comp.speech and its archive on svr-ftp.eng.cam.ac.uk
  137.   (Many of starting point sources).
  138.  
  139. sci.lang
  140.   (For ASCII IPA)
  141.